엔비디아 테그라
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
엔비디아 테그라는 엔비디아가 개발한 시스템 온 칩(SoC) 제품군으로, 저전력 고성능 그래픽을 특징으로 한다. 2008년 APX 2500 발표를 시작으로, 듀얼 코어, 쿼드 코어 CPU와 다양한 GPU 아키텍처를 탑재하며 발전해 왔다. 테그라 2는 듀얼 코어 CPU를, 테그라 3는 쿼드 코어 CPU를 최초로 탑재했으며, 테그라 K1은 고성능 GPU를 통해 이전 세대 게임기의 성능을 넘어서는 그래픽 성능을 제공했다. 이후 테그라 X1, X2, 자비에, 오린, 그레이스, 아틀란, 토르에 이르기까지 지속적으로 발전하며, 닌텐도 스위치, 자동차 인포테인먼트 시스템, AI 및 HPC 애플리케이션 등 다양한 분야에 활용되고 있다.
더 읽어볼만한 페이지
- ARM 기반 시스템 온 칩 - 삼성 엑시노스
삼성 엑시노스는 삼성전자 시스템LSI 사업부에서 설계 및 생산하는 모바일 AP로, 갤럭시 S에 처음 탑재된 이후 다양한 기기에 사용되었으며, ARM 코어와 자체 개발 코어를 거쳐 AMD와 협력하여 RDNA 아키텍처 기반 GPU를 탑재한 제품을 출시하고 있다. - ARM 기반 시스템 온 칩 - 구글 텐서
구글 텐서는 구글이 자체 개발한 시스템 온 칩(SoC)으로, 픽셀 스마트폰 등 구글 하드웨어 제품에 탑재되어 이미지 처리, AI, 머신 러닝 기능을 강화하며, 여러 세대의 모델이 출시되어 성능과 보안을 향상시키는 데 기여한다. - 엔비디아 제품 - 지포스 나우
지포스 나우는 엔비디아에서 제공하는 클라우드 게이밍 서비스로, 엔비디아 그래픽 카드가 탑재된 서버에서 게임을 실행하여 사용자의 장치로 스트리밍하는 방식으로, 사용자는 고사양 PC 없이도 보유한 게임을 즐길 수 있으며, 다양한 요금제와 얼라이언스 파트너를 통해 서비스되고 대한민국에서는 LG유플러스가 제공한다. - 엔비디아 제품 - 스케일러블 링크 인터페이스
스케일러블 링크 인터페이스(SLI)는 여러 개의 그래픽 처리 장치(GPU)로 3차원 컴퓨터 그래픽 렌더링 작업을 분담하는 기술이며, 엔비디아가 PCI Express용으로 개량하여 지포스 시리즈에 적용했다. - 모바일 컴퓨터 - 모바일 컴퓨팅
모바일 컴퓨팅은 휴대성과 연결성을 특징으로 하는 정보 기술 분야이며, 휴대성, 연결성, 상호 작용, 개별성을 주요 원칙으로 다양한 장치를 포함하고 확장성, 전력 소비, 보안 문제 등의 한계를 가지며 차량 내 컴퓨팅 등 특수한 환경에서도 활용된다. - 모바일 컴퓨터 - 전자수첩
전자수첩은 정보를 기록하고 관리하는 휴대용 전자기기로, 1980년대 일본에서 출시되어 주소록, 일정 관리, 메모 기능 등을 제공했으며, 개인용 컴퓨터와 휴대 정보 단말기의 등장으로 시장이 축소되었다.
엔비디아 테그라 | |
---|---|
기본 정보 | |
![]() | |
제품 유형 | 시스템 온 칩 |
브랜드 | 엔비디아 |
출시일 | 2008년 1분기 (Tegra APX 2500) |
중단일 | 2019년 (Tegra TX2) |
중앙 처리 장치 (CPU) | |
명령어 집합 | ARM x86 (단종) |
그래픽 처리 장치 (GPU) | |
제조사 | 엔비디아 |
특징 | |
특징 | 전력 관리 HD 비디오 처리 이미지 처리 |
제품군 | |
제품군 | Tegra APX Tegra 2 Tegra 3 Tegra 4 Tegra K1 Tegra X1 Tegra X2 Tegra Xavier Tegra Orin |
기타 | |
사용 제품 | 스마트폰 태블릿 컴퓨터 휴대용 게임기 자동차 |
2. 역사
엔비디아 테그라는 2008년 2월 APX 2500 모델을 처음 선보였다.[1] 2008년 6월에는 테그라 6xx 제품군이 공개되었고,[2] 2009년 2월에는 APX 2600이 발표되었다. APX 칩은 스마트폰, 테그라 600 및 650 칩은 스마트북과 모바일 인터넷 기기(MID)용으로 설계되었다.[2]
엔비디아 테그라(Tegra)는 다음과 같은 특징을 가지고 있다.
테그라를 탑재한 첫 제품은 2009년 9월 출시된 마이크로소프트의 Zune HD였다.[3] 이후 삼성전자 M1에도 테그라가 탑재되었다.[3] 킨은 테그라를 사용한 최초의 휴대폰이었지만,[4] 앱 스토어가 없어 테그라의 성능을 제대로 활용하지 못했다.
2010년 1월, 엔비디아는 소비자 가전 전시회 2010에서 차세대 테그라인 테그라 250 (테그라 2)를 발표했다.[7] 2011년 2월 모바일 월드 콩그레스에서는 최초의 쿼드 코어 SoC인 테그라 3 (코드명 Kal-El)을 발표했다.[9][10]
2012년 1월, 아우디는 차량용 인포테인먼트 시스템과 디지털 계기판에 테그라 3 프로세서를 채택한다고 발표했다.[11] 이 프로세서는 2013년부터 아우디의 모든 차량에 탑재될 예정이며, ISO 26262 인증을 받았다.[12]
2015년 3월에는 1테라플롭의 그래픽 성능을 가진 테그라 X1이 발표되었다. 2016년 10월, 닌텐도 스위치에 테그라 하드웨어가 탑재될 것이라고 발표되었다.[14] 2017년 3월, 닌텐도 스위치에는 맞춤형 테그라 X1(모델 T210)이 탑재되었으며 클럭 속도가 낮다는 사실이 밝혀졌다.[15]
2011년경에 등장한 테그라 2부터 서서히 태블릿 등에 탑재되기 시작했다.[202] 2017년에 출시된 닌텐도 하이브리드 게임기 닌텐도 스위치에 테그라가 탑재되면서,[207] 2018년에는 테그라만으로 15.3억달러의 수익을 기록했다 (Switch 관련 9.72억달러, 자동차 관련 5.58억달러).[208]
3. 특징
테그라는 모바일 SoC(System on a Chip)의 기본 구조를 따르며, ARM 프로세서, GPU, 2D 엔진, HD 동영상 인코더/디코더, 오디오 및 이미지 처리 등 독립된 기능별 프로세서 코어를 하나의 칩에 탑재한다.[201] 사용하지 않는 기능의 프로세서는 전원을 차단하여 소비 전력을 100~500mW 정도로 낮춘다.[201]
2011년에 출시된 테그라 2부터 태블릿 등에 탑재되기 시작했으며,[202] TV에 연결하여 대화면 출력이 가능하고, PS3, Wii, Xbox 등의 게임 컨트롤러를 연결하여 가정용 게임기 수준의 3D 게임을 즐길 수 있다.[271]
테그라는 스마트폰이나 태블릿 등 모바일 기기용 SoC로서 게임 등에 강한 고성능 처리를 지향했지만, 채용 점유율은 낮았다. 엔비디아는 자체 개발한 태블릿 게임기 엔비디아 실드(nVidia Shield)에 테그라 K1을 탑재하여 점유율 회복을 꾀했다.[203]
2017년 출시된 닌텐도의 하이브리드 게임기 닌텐도 스위치에 테그라가 탑재되었으며,[207] 2018년에는 테그라만으로 15억 3000만 달러의 수익을 기록했다(스위치 9억 7200만 달러, 자동차 5억 5800만 달러).[208]
4. 사양
엔비디아 테그라의 사양은 다음과 같다.
Kepler 이후, 통합 셰이더가 사용됨.
- Tegra 650의 그래픽 성능은 "지포스 6" 시리즈 상당으로, 『퀘이크 3 아레나』를 46fps로 실행할 수 있다.[258]
- Tegra 250은 1024x600 해상도를 60fps로 실행할 수 있다.[259]
- Tegra 3은 12코어의 지포스 GPU를 탑재, Tegra 2 대비 약 3배의 그래픽 성능을 가진다.[260] 1080p, 비디오 재생 및 스테레오스코픽 3D를 지원한다.
- Tegra 4는 72코어 GeForce GPU를 탑재, Tegra 3의 약 6배, Tegra 2의 약 20배의 그래픽 성능을 가진다.[261]
- Tegra K1은 192개 CUDA 코어를 탑재, Tegra 4의 3.75배 그래픽 성능을 가지며,[262] 7세대 가정용 게임기(PS3/Xbox 360) 성능을 넘어섰다.[263]
- Tegra X1은 256개 CUDA 코어를 탑재, Tegra K1의 1.5~2배 그래픽 성능을 가진다. FP16에 대응하며, 최대 1TFLOPS 연산 능력을 가진다.[264][265] HDMI 2.0, HDCP 2.2를 지원하여 60fps 4K 콘텐츠 출력이 가능하며, 내장 하드웨어 비디오 프로세서는 HEVC를 지원, 색 심도는 Deep Color 상당의 10bit까지 지원한다.[266]
- Xavier는 512개 CUDA 코어를 탑재, Volta 아키텍처에 AI 처리를 위한 "텐서 코어"를 탑재하여 Tegra X1 대비 10배 이상 연산 성능을 발휘한다.[267][268] 10W 소비 전력의 NX 시리즈(8GB/16GB)와 40W 소비 전력의 AGX 시리즈(AGX 32GB/64GB, Industrial)가 있다.[253]
- Orin은 Xavier의 6배 처리 성능을 제공한다.[253] 7W 소비 전력부터 최대 70W 소비 전력의 Nano, NX, AGX 3개 시리즈 9개 모델이 있다.[269][253]
4. 1. 테그라 APX
테그라 APX 시리즈는 엔비디아가 초기 출시한 모바일 프로세서 제품군이다.제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | ||
---|---|---|---|---|---|---|---|---|---|
Tegra APX 2500, 2600 | ARM11 | 1코어, 0.6 GHz | NEON 미지원 (Advanced SIMD) | LPDDR-333 | 720p@30fps | 854x480 (LCD) 1280x1024 (CRT) 1280x720 (HDMI) | |||
Tegra 600 | 1280x1024 | ||||||||
Tegra 650 | 1코어, 0.8 GHz | LPDDR-400 | 1080p@24fps | 1680x1050 |
- '''테그라 600'''은 GPS 및 자동차 분야를 타겟으로 ARM11 700MHz MPCore 프로세서와 저전력 DDR (DDR-333, 166MHz) 메모리를 사용한다. SXGA, HDMI, USB, 스테레오 잭, HD 카메라 720p를 지원한다.
- '''테그라 650'''은 휴대용 기기 및 노트북의 GTX를 타겟으로, ARM11 800MHz MPCore 프로세서와 저전력 DDR (DDR-400, 200MHz) 메모리를 사용한다. 1W 미만의 전력을 소비하며, HD 이미지 처리를 지원한다. 1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력을 지원하며, Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치를 직접 지원한다. Windows Mobile 기반 설계를 위한 보드 지원 패키지(BSP)를 제공한다.
4. 1. 1. 테그라 APX 2500
테그라 APX 2500은 ARM11 600 MHz MPCore (원래 지포스 ULV) 프로세서를 기반으로 하며, NOR 또는 NAND 플래시 메모리와 Mobile DDR 메모리를 사용한다. 그래픽은 이미지 프로세서 (FWVGA 854×480 픽셀)를 사용하며, 최대 12 메가픽셀 카메라와 최대 1280×1024 해상도의 LCD 컨트롤러를 지원한다. 저장 장치로는 SSD용 IDE를 지원하며, 비디오 코덱은 최대 720p MPEG-4 AVC/H.264 및 VC-1 디코딩을 지원한다. OpenGL ES 2.0, Direct3D Mobile 및 프로그래밍 가능 셰이더를 지원하는 GeForce ULV를 포함한다. 출력은 HDMI, VGA, composite video, S-Video, 스테레오 잭, USB를 지원하며, USB On-The-Go 기능을 제공한다.[16]4. 1. 2. 테그라 APX 2600
wikitext엔비디아 테그라 APX 2600은 자료가 충분하지 않아, 테그라 250과 함께 요약되어 있다.
4. 2. 테그라 6xx
테그라 6xx 시리즈는 테그라 APX 시리즈의 후속 제품군으로, 주로 모바일 기기 및 임베디드 시스템을 대상으로 설계되었다.모델 | 프로세서 | 메모리 | 특징 | 주요 용도 |
---|---|---|---|---|
테그라 600 | ARM11 700MHz MPCore | 저전력 DDR (DDR-333, 166MHz) | SXGA, HDMI, USB, 스테레오 잭, HD 카메라 720p 지원 | GPS 및 자동차 분야 |
테그라 650 | ARM11 800MHz MPCore | 저전력 DDR (DDR-400, 200MHz) | 1W 미만 소비 전력, HD 이미지 처리, 1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력, Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치 직접 지원, Windows Mobile 기반 설계를 위한 보드 지원 패키지(BSP) 제공 | 휴대용 기기 및 노트북 |
하위 섹션에서 이미 상세히 다루고 있으므로, 테그라 600과 테그라 650에 대한 간략한 정보만 표 형태로 제공하여 중복을 최소화하였다.
4. 2. 1. 테그라 600
- GPS 및 자동차 분야를 타겟으로 한다.
- 프로세서: ARM11 700MHz MPCore
- 메모리: 저전력 DDR (DDR-333, 166MHz)
- SXGA, HDMI, USB, 스테레오 잭을 지원한다.
- HD 카메라 720p를 지원한다.
4. 2. 2. 테그라 650
테그라 650은 휴대용 기기 및 노트북을 겨냥한 GTX 제품군이다. ARM11 800MHz MPCore 프로세서를 탑재했으며, 저전력 DDR (DDR-400, 200MHz) 메모리를 사용한다. 1W 미만의 낮은 소비 전력을 특징으로 하며, 고급 디지털 카메라 및 HD 캠코더 기능을 위한 HD 이미지 처리를 지원한다.[209]1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력을 지원한다. Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치를 직접 지원하며, Windows Mobile 기반 설계를 빠르게 출시할 수 있도록 완벽한 보드 지원 패키지(BSP)를 제공한다.[209]
4. 3. 테그라 2

테그라 2는 2세대 테그라로, 1GHz Cortex A9 듀얼 코어 CPU와 ULP(Ultra Low Power) GeForce GPU, 싱글 채널 DDR2 메모리 컨트롤러를 탑재했다. 코어당 32KB/32KB L1 캐시와 1MB 공유 L2 캐시를 가지고 있다.[281][282]
테그라 2는 SoC 하드웨어 코덱이 지원하는 포맷이 제한적이다. 소프트웨어 가속을 하더라도 ARM NEON 명령어를 지원하지 않아 동영상 디코딩 성능이 떨어진다. ARM NEON을 지원하는 이전 세대 싱글 코어 AP보다 성능이 낮으며, 퀄컴의 스냅드래곤 S3 프로세서와 비교해도 성능 차이가 크지 않은 듀얼 코어 프로세서이다.
4. 3. 1. 모델
엔비디아 테그라 250 AP20H (Ventana)는 40nm 공정으로 제조되었으며, ARMv7 아키텍처를 기반으로 한다. 1 GHz ARM Cortex-A9 듀얼 코어 CPU와 ULP GeForce 300 MHz GPU를 탑재하고 있다. 32비트 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR2 메모리를 지원하며, 2010년 1분기에 출시되었다. LG 옵티머스 2X, 모토로라 아트릭스 등의 기기에 사용되었다.[281][282]테그라 250 T20 (Harmony)는 AP20H와 동일한 CPU를 사용하지만, GPU 클럭이 333 MHz로 약간 더 높다. 모토로라 줌, 삼성 갤럭시 탭 10.1 등에 사용되었다.[281][282]
테그라 250 3D AP25와 T25는 1.2 GHz CPU와 400 MHz GPU를 탑재하여 성능이 향상되었다. AP25는 LG 옵티머스 Q2, LG 옵티머스 EX에 사용되었다.
테그라 600 시리즈는 GPS 및 자동차 분야를 타겟으로 하며, 테그라 600은 ARM11 700MHz MPCore CPU와 저전력 DDR (DDR-333, 166MHz) 메모리를 탑재했다. 테그라 650은 ARM11 800MHz MPCore CPU와 저전력 DDR (DDR-400, 200MHz) 메모리를 탑재했으며, 1W 미만의 소비 전력을 가진다.
테그라 4i(코드명 "그레이")는 2013년 2월 19일에 발표되었으며, Cortex-A9 코어를 사용하여 테그라 4의 저전력 변종으로 설계되었다. Icera i500 LTE/HSPA+ 베이스밴드 프로세서를 통합한다.[48]
테그라 K1(코드명 "로건")은 ARM Cortex-A15 코어 또는 엔비디아의 64비트 프로젝트 덴버 듀얼 코어 프로세서와 케플러 GPU를 특징으로 한다.[73][74]
테그라 K1은 32비트 버전과 64비트 버전으로 나뉜다. 32비트 버전은 Cortex-A15 R3 4+1 코어, 64비트 버전은 Denver 듀얼 코어를 사용한다. 두 버전 모두 GK20A (케플러) GPU를 탑재했다.[80][81][82][83]
다음은 모델별 상세 사양을 표로 정리한 것이다.
모델명 | 반도체 공정 | CPU 아키텍처 | CPU | GPU | 지원 메모리 | 출시일 |
---|---|---|---|---|---|---|
테그라 250 AP20H (Ventana) | 40nm | ARMv7 | 1 GHz ARM Cortex-A9 듀얼 코어 | ULP GeForce 300 MHz | 32-bit 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR2 | 2010년 1분기 |
테그라 250 T20 (Harmony) | 40nm | ARMv7 | 1 GHz ARM Cortex-A9 듀얼코어 | ULP GeForce 333 MHz | 32비트 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR2 | 2010년 1분기 |
테그라 250 3D AP25 | 40nm | ARMv7 | 1.2 GHz ARM Cortex-A9 듀얼 코어 | ULP GeForce 400 MHz | 32비트 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR2 | 2011년 1분기 |
테그라 250 3D T25 | 40nm | ARMv7 | 1.2 GHz dual-core ARM Cortex-A9 | ULP GeForce 400 MHz | 32-bit Single-channel 600 MHz LPDDR2 또는 667 MHz DDR2 | 2011년 1분기 |
모델 번호 | CPU | GPU | 메모리 | 채택 | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|
프로세서 | 코어 | 주파수 | 마이크로아키텍처 | 코어 구성1 | 주파수 | 유형 | 용량 | 버스 폭 | 대역 폭 | 출시 | |
T148?[66] | Cortex-A9 "R4" | 4+1 | 최대 2.0 GHz | VLIW 기반 VEC4 유닛[67] | 60 (48:12:2)[67] | 660 MHz[50] | LPDDR3 | 32비트 단일 채널 | 6.4–7.5 GB/s (800–933 MHz)[52] | 2014년 1분기 |
모델 번호 | CPU | GPU | 메모리 | 채택 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
프로세서 | 코어 | 주파수 | 마이크로- 아키텍처 | 코어 구성1 | 주파수 | GFLOPS (FP32) | 유형 | 용량 | 버스 폭 | 대역- 폭 | 사용 가능 여부 | |
T124[80] | Cortex-A15 R3 (32비트) | 4+1 | 최대 2.3 GHz[81] | GK20A (케플러) | 192:8:4[82] | 756–951 MHz | 290–365[83] | DDR3L LPDDR3[82] | 최대 8 GB 40비트 주소 확장2 사용 | 64 비트 | 17 GB/s[82] | 2014년 2분기 |
T132 | Denver (64비트) | 2[82] | 최대 2.5 GHz[81] | 최대 8 GB | ? | ? | 2014년 3분기 |
1 통합 셰이더: 텍스처 매핑 유닛 : 렌더 출력 유닛2 ARM LPAE(Large Physical Page Extension)는 1 TiB (240 바이트)를 지원한다. 8 GiB 제한은 부품별로 다르다.
rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Tegra K1 | 28 nm[232] (TSMC HPM) | Cortex-A15 r3 | 4 + 1 | ? - 2.3 GHz | 단정밀도 73.6 GFLOPS[233] 배정밀도 18.4 GFLOPS[234] | 2 MB + 0.5 MB[235] | CUDA Kepler Unified Shader 192 코어 | 950 MHz | 단정밀도 365 GFLOPS[236] | 64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s | H.264, VP8 등 2160p 30fps | 3840x2160 (LCD) 4096x2160 (HDMI) | 없음 |
Tegra K1 | Denver | 2 | ? - 2.5 GHz[237] | 단정밀도 40 GFLOPS[238] 배정밀도 20 GFLOPS[239] | 2 MB[240] | ||||||||
Tegra X1[241] | 20 nm (TSMC 20 SoC) | Cortex-A57 + Cortex-A53[242] | 4 + 4[243] | Cortex-A57 1.9 GHz[244] | rowspan="2" | | 2 MB + 0.5 MB[245] | CUDA Maxwell 256 코어[246] | 1024 MHz | 단정밀도 512 GFLOPS[247] | 64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s[248] | H.265, VP9 등 2160p 30fps | 4096x2160 60fps | |
Tegra X1+[249][250] | 16 nm | 1267 MHz[251] | 단정밀도 649 GFLOPS | 64bit LPDDR4X | |||||||||
Tegra X2 (Parker)[252] | 16 nm | Denver 2 + Cortex-A57 | 2 + 4 | 2.0 GHz + 2.0 GHz | 2 MB + 2 MB | CUDA Pascal 256 코어 | 1465 MHz | 단정밀도 750 GFLOPS | 128bit LPDDR4 58.4 GB/s | H.265, VP9 등 2160p 60fps |
rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | L3 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Xavier[253] | 12 nm | NVIDIA Carmel Arm®v8.2 | 8 | 1.9GHz(Nano) 2.2 GHz(AGX) | 6MBr[253] | 4MB[253] | CUDA Volta 384코어 Tensor 48코어(Nano) | 1.1 GHz(Nano) | 단정밀도 1410 GFLOPS | 128bit LPDDR4X 59.7 GB/s | H.265,VP9 등 4K 60fps | 3840x2160 60fps | ||
Orin[255] | 8 nm | Cortex®-A78AE v8.2 | 12 | 1.5GHz(Nano) 2.2 GHz(AGX) | 1.5MB(Nano) 3MB(AGX) | 4MB(Nano) 6MB(AGX) | CUDA Ampere 512코어 Tensor 16코어(Nano) | 625 MHz(Nano) | 단정밀도 0.64 – 5.32 TFLOPS | 128bit LPDDR5 102.4 GB/s | H.265,VP9,AV1 등 4K 60fps | 3840x2160 60fps |
4. 4. 테그라 3 (칼엘)
테그라 3(코드명 "칼엘")은 쿼드 코어 ARM Cortex-A9 CPU와 저전력 상황에서 작동하는 컴패니언 코어를 결합한 "4-PLUS-1" 아키텍처를 사용한다. 이 기술은 상황에 따라 4개의 주 코어 또는 저전력 컴패니언 코어를 활용하여 전체 소비 전력을 줄이는 방식이다.[283]엔비디아 ULP GeForce GPU는 테그라 2 GPU에서 발전된 형태로, 4개의 픽셀 셰이더 유닛이 추가되었고 더 높은 클럭으로 작동한다. 최대 2560x1600 해상도의 비디오 출력을 지원하며, 1080p H.264 High-Profile @ 40 Mbps의 하드웨어 비디오 가속을 지원한다. 이전 세대와 달리 NEON SIMD 확장 기능을 지원한다.
4. 4. 1. 모델
3세대 테그라는 네 개의 1.3Ghz Cortex A9 코어와 "컴패니언" 코어로 불리는 저전력 저클럭의 서브코어로 구성되어 있다. 엔비디아는 로드가 낮을 때 다른 코어는 모두 오프라인 상태로 만들고 컴패니언 코어만 사용해 연산을 하여 전력소모를 최대 61%까지 줄였다고 주장한다.[283] 이 새로운 방식의 코어로 인해 테그라 3는 종종 4+1 코어로 불린다.이전 세대의 테그라와는 달리 NEON SIMD 명령어를 탑재하였으며 2560x1600 해상도의 화면 출력과 1080p H264 High-Profile @ 40 Mbps의 하드웨어 동영상 가속을 지원한다.
모델명 | 반도체 공정 | CPU 아키텍처 | CPU | CPU 캐시 | GPU | 메모리 지원 | 출시시기 | 탑재 기기 |
---|---|---|---|---|---|---|---|---|
테그라 3 T30L | 40 nm LPG by TSMC | ARMv7 | 1.2 GHz 쿼드코어 ARM Cortex-A9 (싱글 코어 모드에서 최대 1.3 GHz) | L1: 32 KB instruction + 32 KB data, L2: 1 MB | 416 MHz ULP GeForce | 32-비트 싱글채널 667 MHz DDR3[284] | 2012년 1분기 | ASUS Transformer Pad 300, 에이수스 :en:Nexus 7[285] |
테그라 3 T30 | 40 nm LPG by TSMC | ARMv7 | 1.4 GHz 쿼드코어 ARM Cortex-A9 (싱글코어 가동시 1.5 GHz) | L1: 32 KB instruction + 32 KB data, L2: 1 MB | 520 MHz ULP GeForce | 32비트 싱글채널 1066 MHz LPDDR2 또는 1500 MHz DDR3-L[286] | 2011년 4분기 | :en:Asus Eee Pad Transformer Prime,[287] IdeaTab K2 / LePad K2,[288] :en:Acer Iconia Tab A510, :en:Acer Iconia Tab A700, :en:LG Optimus 4X HD, :en:HTC One X, ZTE Era, ZTE PF 100, ZTE T98, Toshiba AT270, Toshiba AT300 (Excite 10), Asus Tablet 610, Fuhu Inc. nabi 2 Tablet[289], :en:Tesla Model S |
테그라 3 T33 | 40 nm LPG by TSMC | ARMv7 | 1.6 GHz 쿼드코어 ARM Cortex-A9 (싱글코어 가동시 1.7 GHz)[290] | L1: 32 KB instruction + 32 KB data, L2: 1 MB | 520 MHz ULP GeForce | 32비트 싱글채널 1600 MHz DDR3[291] | 2012년 2분기 | ASUS Transformer Pad Infinity 700 (TF700T), :en:Ouya |
; 테그라 600
- GPS 및 자동차 분야 타겟
- 프로세서: ARM11 700MHz MPCore
- 메모리: 저전력 DDR (DDR-333, 166MHz)
- SXGA, HDMI, USB, 스테레오 잭
- HD 카메라 720p
; 테그라 650
- 휴대용 기기 및 노트북의 GTX 타겟
- 프로세서: ARM11 800MHz MPCore
- 저전력 DDR (DDR-400, 200MHz)
- 1W 미만 소비 전력
- 고급 디지털 카메라 및 HD 캠코더 기능을 위한 HD 이미지 처리
- 디스플레이는 1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력을 지원
- Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치 직접 지원
- Windows Mobile 기반 설계를 위한 빠른 출시를 가능하게 하는 완벽한 보드 지원 패키지(BSP)
모델 | 장치 |
---|---|
T124 | Jetson TK1 개발 보드,[84] 엔비디아 쉴드 태블릿(Shield Tablet),[85] 에이서 크롬북 13,[86] HP 크롬북 14 G3,[87] 샤오미 미패드,[88] 스네일 게임즈(Snail Games) OBox, UTStarcom MC8718, 구글 프로젝트 탱고 태블릿,[89] 아팔리스 TK1 시스템 온 모듈,[90] 퓨즈 토마호크 F1,[91] JXD 싱귤래리티 S192[92] |
T132 | HTC 넥서스 9(Nexus 9)[93][94] |
2015년에 출시된 엔비디아의 Tegra X1(코드명 "Erista")은 두 개의 CPU 클러스터를 특징으로 하며, 하나는 4개의 ARM Cortex-A57 코어를, 다른 하나는 4개의 ARM Cortex-A53 코어를, 그리고 Maxwell 기반의 그래픽 처리 장치를 가지고 있다.[96][97]
Adaptive Scalable Texture Compression을 지원한다.[76]
공식적으로 '''Tegra X1+'''로 알려진, 전력 효율성이 향상된 개정판(코드명 "Mariko")은 2019년에 출시되었다.[102] 또한 T214 및 T210B01로 알려져 있다.
- CPU: ARMv8 ARM Cortex-A57 쿼드 코어(64비트) + (미사용?) ARM Cortex-A53 쿼드 코어(64비트)
- GPU: Maxwell 기반 256 코어 GPU (Jetson Nano: 128코어만)
- MPEG-4 HEVC VP8 인코딩/디코딩 및 VP9 디코딩 지원[103] (Jetson Nano: 인코더는 H.265, H.264/스테레오, VP8, JPEG; 디코더는 H.265, H.264/스테레오, VP8, VP9, VC-1, MPEG-2, JPEG)
- TSMC 20 nm 공정 (Tegra X1)
- TSMC 16 nm 공정 (Tegra X1+)
- TDP:
- * T210: 15 W,[104] 평균 전력 소비는 10 W 미만[103]
- * Jetson Nano: 10 W(모드 0);[105] 모드 1: 5W(2개의 CPU 코어만 @ 918 MHz, GPU @ 640 MHz)
모델 번호 | SOC 변형 | 공정 | CPU | GPU | 메모리 | 채택 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
프로세서 | 코어 | 주파수1 | 마이크로- 아키텍처 | 코어 구성2 | 주파수 | GFLOPS (FP32) | GFLOPS (FP16) | 유형 | 용량3 | 버스 너비 | 대역- 폭4 | 사용 가능 여부 | |||
T210 | ODNX02-A2 | TSMC 20 nm | Cortex-A57 + Cortex-A53[106] | A57: 4 A53: 4[106] | A57: 2.2 GHz[107] A53: 1.3 GHz | GM20B (Maxwell)[106] | 256:[106] 16:16 | 1000 MHz | 512 | 1024 | LPDDR3 / LPDDR4 | 8 GB[106] | 64 비트[106] | 25.6 GB/s | 2015년 2분기 |
TM660M-A2 | A57: 1.428 GHz A53: ? GHz | 128:16:16 | 921 MHz | 236 | 472 | LPDDR3? / LPDDR4 | 4 GB | 2019년 3월 | |||||||
T214 / T210b01 | ODNX10-A1 | TSMC 16 nm | Cortex-A57 | A57: 4 | A57: 2.1 GHz[108] | GM21B (Maxwell)[109] | 256:16:16 | 1267 MHz[110] | 649 | 1298 | LPDDR4 /LPDDR4X | 8 GB | 34.1 GB/s | 2019년 2분기 |
rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Tegra K1 | 28 nm[232] (TSMC HPM) | Cortex-A15 r3 | 4 + 1 | ? - 2.3 GHz | 단정밀도 73.6 GFLOPS[233] 배정밀도 18.4 GFLOPS[234] | 2 MB + 0.5 MB[235] | CUDA Kepler Unified Shader 192 코어 | 950 MHz | 단정밀도 365 GFLOPS[236] | 64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s | H.264, VP8 등 2160p 30fps | 3840x2160 (LCD) 4096x2160 (HDMI) | 없음 |
Tegra K1 | Denver | 2 | ? - 2.5 GHz[237] | 단정밀도 40 GFLOPS[238] 배정밀도 20 GFLOPS[239] | 2 MB[240] | ||||||||
Tegra X1[241] | 20 nm (TSMC 20 SoC) | Cortex-A57 + Cortex-A53[242] | 4 + 4[243] | Cortex-A57 1.9 GHz[244] | rowspan="2" | | 2 MB + 0.5 MB[245] | CUDA Maxwell 256 코어[246] | 1024 MHz | 단정밀도 512 GFLOPS[247] | 64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s[248] | H.265, VP9 등 2160p 30fps | 4096x2160 60fps | |
Tegra X1+[249][250] | 16 nm | 1267 MHz[251] | 단정밀도 649 GFLOPS | 64bit LPDDR4X | |||||||||
Tegra X2 (Parker)[252] | 16 nm | Denver 2 + Cortex-A57 | 2 + 4 | 2.0 GHz + 2.0 GHz | 2 MB + 2 MB | CUDA Pascal 256 코어 | 1465 MHz | 단정밀도 750 GFLOPS | 128bit LPDDR4 58.4 GB/s | H.265, VP9 등 2160p 60fps |
rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | L3 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Xavier[253] | 12 nm | NVIDIA Carmel Arm®v8.2 | 8 | 1.9GHz (Nano) 2.2 GHz (AGX) | 6MB[253] | 4MB[253] | CUDA Volta 384코어 Tensor 48코어 (Nano) | 1.1 GHz (Nano) | 단정밀도 1410 GFLOPS | 128bit LPDDR4X 59.7 GB/s | H.265,VP9 등 4K 60fps | 3840x2160 60fps | ||
Orin[255] | 8 nm | Cortex®-A78AE v8.2 | 12 | 1.5GHz (Nano) 2.2 GHz (AGX) | 1.5MB (Nano) 3MB (AGX) | 4MB (Nano) 6MB (AGX) | CUDA Ampere 512코어 Tensor 16코어 (Nano) | 625 MHz (Nano) | 단정밀도 0.64 – 5.32 TFLOPS | 128bit LPDDR5 102.4 GB/s | H.265,VP9,AV1 등 4K 60fps | 3840x2160 60fps |
4. 5. 테그라 4 (웨인)
테그라 4(코드명 "웨인")는 2013년 초에 출시된 시스템 온 칩(SoC)이다.[261]테그라 4는 ARM Cortex-A15 CPU와 저전력 Cortex-A15 컴패니언 코어를 탑재한 쿼드 코어 프로세서로, 테그라 3와 유사한 가변 SMP 아키텍처(4+1 코어)를 사용하며 1.9GHz로 작동한다. 72코어 ULP 지포스 GPU를 탑재하여 이전 제품보다 향상된 기능과 효율성을 제공한다.[261]
최대 1080p 60Mbit/s @ 60fps의 WebM 비디오 하드웨어 디코딩 및 인코딩을 지원하며, Icera 인수 후 개발된 소프트웨어 정의 라디오 i500을 통해 카테고리 3(100Mbit/s) LTE를 지원하고, 추후 카테고리 4(150Mbit/s) 업데이트가 예정되어 있다.
4. 5. 1. 모델
모델명 | 반도체 공정 | CPU 아키텍처 | CPU | GPU | 지원 메모리 | 출시일 | 사용 기기 | 통신칩 |
---|---|---|---|---|---|---|---|---|
테그라 4 T40 | 28 nm | ARMv7 | 1.8 GHz ARM Cortex-A15 쿼드 코어 | ULP GeForce 672 MHz | 32-bit 듀얼채널 ?? MHz LPDDR3& ?? MHz DDR3L | 2013 Q1 | ||
테그라 4 T43 | 28 nm | ARMv7 | 2.0 GHz ARM Cortex-A15 쿼드 코어 | ULP GeForce 672 MHz | 32비트 듀얼채널 ?? MHz LPDDR3& ?? MHz DDR3L | 2013 Q3 | ||
테그라 4 AP40 | 28 nm | ARMv7 | ?? GHz ARM Cortex-A15 쿼드 코어 | ULP GeForce 672 MHz | 32비트 듀얼채널 ?? MHz LPDDR3& ?? MHz DDR3L | 2013 Q3 | ||
테그라 4i SP3X | 28 nm | ARMv7 | 2.3 GHz ARM Cortex-A9 쿼드 코어 | ULP GeForce 400 MHz | 32-bit 듀얼채널 ?? MHz LPDDR3 | 2013 Q3 | i500 LTE 베이스밴드, TD-SCDMA/WCDMA/FDD-LTE/TD-LTE | |
rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Tegra K1 | 28 nm[232] (TSMC HPM) | Cortex-A15 r3 | 4 + 1 | ? - 2.3 GHz | 단정밀도 73.6 GFLOPS[233] 배정밀도 18.4 GFLOPS[234] | 2 MB + 0.5 MB[235] | CUDA Kepler Unified Shader 192 코어 | 950 MHz | 단정밀도 365 GFLOPS[236] | 64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s | H.264, VP8 등 2160p 30fps | 3840x2160 (LCD) 4096x2160 (HDMI) | 없음 |
Tegra K1 | Denver | 2 | ? - 2.5 GHz[237] | 단정밀도 40 GFLOPS[238] 배정밀도 20 GFLOPS[239] | 2 MB[240] | ||||||||
Tegra X1[241] | 20 nm (TSMC 20 SoC) | Cortex-A57 + Cortex-A53[242] | 4 + 4[243] | Cortex-A57 1.9 GHz[244] | rowspan="2" | | 2 MB + 0.5 MB[245] | CUDA Maxwell 256 코어[246] | 1024 MHz | 단정밀도 512 GFLOPS[247] | 64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s[248] | H.265, VP9 등 2160p 30fps | 4096x2160 60fps | |
Tegra X1+[249][250] | 16 nm | 1267 MHz[251] | 단정밀도 649 GFLOPS | 64bit LPDDR4X | |||||||||
Tegra X2 (Parker)[252] | 16 nm | Denver 2 + Cortex-A57 | 2 + 4 | 2.0 GHz + 2.0 GHz | 2 MB + 2 MB | CUDA Pascal 256 코어 | 1465 MHz | 단정밀도 750 GFLOPS | 128bit LPDDR4 58.4 GB/s | H.265, VP9 등 2160p 60fps |
rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | L3 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Xavier[253] | 12 nm | NVIDIA Carmel Armv8.2 | 8 | 1.9GHz (Nano) 2.2 GHz (AGX) | 6MB[253] | 4MB[253] | CUDA Volta 384코어 Tensor 48코어 (Nano) | 1.1 GHz (Nano) | 단정밀도 1410 GFLOPS | 128bit LPDDR4X 59.7 GB/s | H.265, VP9 등 4K 60fps | 3840x2160 60fps | ||
Orin[255] | 8 nm | Cortex-A78AE v8.2 | 12 | 1.5GHz (Nano) 2.2 GHz (AGX) | 1.5MB (Nano) 3MB (AGX) | 4MB (Nano) 6MB (AGX) | CUDA Ampere 512코어 Tensor 16코어 (Nano) | 625 MHz (Nano) | 단정밀도 0.64 – 5.32 TFLOPS | 128bit LPDDR5 102.4 GB/s | H.265, VP9, AV1 등 4K 60fps | 3840x2160 60fps |
모델 번호 | CPU | GPU | 메모리 | 채택 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
프로세서 | 코어 | 주파수 | 마이크로- 아키텍처 | 코어 구성1 | 주파수 | GFLOPS (FP32) | GFLOPS (FP16) | 유형 | 용량 | 버스 폭 | 대역- 폭 | 사용 가능 여부 | |
T186 | 덴버2 + Cortex-A57 | 2 + 4 | 덴버2: 1.4–2.0 GHz A57: 1.2–2.0 GHz | GP10B (파스칼)[122] | 256:16:16 (2)[123] | 854–1465 MHz | 437–750 | 874–1500 | LPDDR4 | 8 GB | 128 비트 | 59.7 GB/s |
1 통합 셰이더: 텍스처 매핑 유닛 : 렌더 출력 유닛 (SM 수)
4. 6. 테그라 4i (그레이)
테그라 4i는 휴대폰 및 태블릿용으로 설계된 쿼드 코어 ARM Cortex-A9 CPU 기반의 저전력 프로세서이다.[221] 테그라 4의 변종으로, Icera i500 LTE/HSPA+ 베이스밴드 프로세서를 통합하여 통신 기능을 강화한 점이 특징이다.[221]2013년에 출시되었으며, 주요 특징은 다음과 같다.
- CPU: 쿼드 코어 ARM Cortex-A9 R4 (최대 2.3 GHz)[221]
- GPU: 60개 ULP 지포스 코어 (20 버텍스 셰이더 : 40 픽셀 셰이더)[224]
- 메모리: 32bit 싱글 채널 LPDDR3-2133[221]
- 연산 성능: 단정밀도 36.8 GFLOPS, 배정밀도 13.8 GFLOPS[222][223]
- 통신: Icera i500 LTE/HSPA+ 통합[221] (LTE Cat4, HSPA+, TD-HSPA, GSM/GPRS/EDGE 지원)
- 제조 공정: 28 nm HPM[221]
- 화면 해상도: 최대 1920x1200 (LCD), 1920x1080 (HDMI)[221]
- VFPv4 및 NEON (Advanced SIMD) 지원[221]
테그라 4i는 테그라 4와 테그라 3 사이의 성능을 제공한다.
4. 6. 1. 모델
엔비디아 테그라의 모델별 상세 정보는 다음과 같다.rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Tegra K1 | 28 nm[232] (TSMC HPM) | Cortex-A15 r3 | 4 + 1 | ? - 2.3 GHz | 단정밀도 73.6 GFLOPS[233] 배정밀도 18.4 GFLOPS[234] | 2 MB + 0.5 MB[235] | CUDA Kepler Unified Shader 192 코어 | 950 MHz | 단정밀도 365 GFLOPS[236] | 64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s | H.264, VP8 등 2160p 30fps | 3840x2160 (LCD) 4096x2160 (HDMI) | 없음 |
Tegra K1 | Denver | 2 | ? - 2.5 GHz[237] | 단정밀도 40 GFLOPS[238] 배정밀도 20 GFLOPS[239] | 2 MB[240] | ||||||||
Tegra X1[241] | 20 nm (TSMC 20 SoC) | Cortex-A57 + Cortex-A53[242] | 4 + 4[243] | Cortex-A57 1.9 GHz[244] | rowspan="2" | | 2 MB + 0.5 MB[245] | CUDA Maxwell 256 코어[246] | 1024 MHz | 단정밀도 512 GFLOPS[247] | 64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s[248] | H.265, VP9 등 2160p 30fps | 4096x2160 60fps | |
Tegra X1+[249][250] | 16 nm | 1267 MHz[251] | 단정밀도 649 GFLOPS | 64bit LPDDR4X | |||||||||
Tegra X2 (Parker)[252] | 16 nm | Denver 2 + Cortex-A57 | 2 + 4 | 2.0 GHz + 2.0 GHz | 2 MB + 2 MB | CUDA Pascal 256 코어 | 1465 MHz | 단정밀도 750 GFLOPS | 128bit LPDDR4 58.4 GB/s | H.265, VP9 등 2160p 60fps |
rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | L3 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Xavier[253] | 12 nm | NVIDIA Carmel Arm®v8.2 | 8 | 1.9GHz(Nano) 2.2 GHz(AGX) | 6MB[253] | 4MB[253] | CUDA Volta 384코어 Tensor 48코어(Nano) | 1.1 GHz(Nano) | 단정밀도 1410 GFLOPS | 128bit LPDDR4X 59.7 GB/s | H.265,VP9 등 4K 60fps | 3840x2160 60fps | ||
Orin[255] | 8 nm | Cortex®-A78AE v8.2 | 12 | 1.5GHz(Nano) 2.2 GHz(AGX) | 1.5MB(Nano) 3MB(AGX) | 4MB(Nano) 6MB(AGX) | CUDA Ampere 512코어 Tensor 16코어(Nano) | 625 MHz(Nano) | 단정밀도 0.64 – 5.32 TFLOPS | 128bit LPDDR5 102.4 GB/s | H.265,VP9,AV1 등 4K 60fps | 3840x2160 60fps |
모델 | 기기 |
---|---|
T186 | 엔비디아 드라이브 PX2 (변형), ZF ProAI 1.1[124] |
T186 | 엔비디아 젯슨 TX2 |
메르세데스-벤츠 MBUX (인포테인먼트 시스템)[125] | |
1개의 유닛과 1개의 GPU 반도체는 2016년 10월부터 모든 테슬라(Tesla, Inc.) 차량의 "테슬라 비전" 기능에 대한 ECU의 일부[126][127] | |
T186 | 매직 리프 원(Magic Leap One)[128][129] (혼합 환경 글래스) |
스카이디오 2 (드론)[130] |
'''자비에르(Xavier)''' 테그라(Tegra) SoC는 프로페서 X의 이름을 따서 명명되었으며, 2016년 9월 28일에 발표되었고, 2019년 3월까지 출시되었다.[131] 70억 개의 트랜지스터, 8개의 커스텀 ARMv8 코어, 512개의 CUDA 코어를 가진 볼타 GPU, DLA(Deep Learning Accelerator)라는 오픈 소스 TPU를 포함하고 있다.[132][133] 칩은 8K 울트라 HD (7680×4320)를 인코딩하고 디코딩할 수 있다. 10 W, 15 W, 30 W TDP에서 작동 모드를 구성할 수 있으며, 다이 크기는 350 mm2이다.[134][135][136] 2018년 CES에서 제조 공정이 12 nm FinFET임을 확인했다.[137]
- CPU: 엔비디아 커스텀 카멜(Carmel) ARMv8.2-A (64비트), 8코어 10-와이드 수퍼스칼라[138]
- GPU: 볼타 기반, 1.4 TFLOPS의 512 CUDA 코어;[139] 유형: GV11B[140][120]
- TSMC 12 nm, FinFET 공정
- 20 TOPS DL 및 160 SPECint @ 20 W; 30 TOPS DL @ 30 W[136] (TOPS DL = Deep Learning Tera-Ops)
- * GPU 기반 텐서 코어를 통해 20 TOPS DL
- * DLA 유닛을 통해 10 TOPS DL (INT8), 5 TFLOPS (FP16) 달성[139]
- PVA 유닛(Programmable Vision Accelerator, 스테레오 불일치/광학 흐름/이미지 처리를 위한)[141]에서 1.6 TOPS
- ISP 유닛(이미지 신호 프로세서, 네이티브 풀 레인지 HDR 및 타일 처리 지원)에서 1.5 GPix/s
- 8k 비디오 지원을 포함한[135] 1.2 GPix/s 인코딩 및 1.8 GPix/s 디코딩을 위한 비디오 프로세서[139]
- 16 레인의 MIPI-CSI-3[142][143]
- 1 Gbit/s 이더넷
- 10 Gbit/s 이더넷
모듈 | SoC 변형 | CPU | GPU | 딥 러닝 | 메모리 | 채택 | TDP (W) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
프로세서 | 코어 | 주파수 | 마이크로- 아키텍처 | 코어 구성1 | 주파수 | TFLOPS (FP32) | TFLOPS (FP16) | TOPS | 유형 | 용량 | 버스 폭 | 대역- 폭 | 사용 가능성 | |||
AGX 자비에르(Xavier) 64 GB | 카멜(Carmel) 12 MB 캐시 | 8 | 최대 2.2 | 볼타 | 512:64 (8, 4, 1) | 최대 1377 | 1.41 | 2.82 | 최대 32 | LPDDR4X | 64 GB | 256-비트 | 136.5 GB/s | 10-30 | ||
AGX 자비에르(Xavier) 32 GB | 카멜(Carmel) 12 MB 캐시 | 8 | 최대 2.2 | 볼타 | 512:64 (8, 4, 1) | 최대 1377 | 1.41 | 2.82 | 최대 32 | LPDDR4X | 32 GB | 256-비트 | 136.5 GB/s | 10-30 | ||
AGX 자비에르(Xavier) 산업용 | 카멜(Carmel) 12 MB 캐시 | 8 | 최대 2 | 볼타 | 512:64 (8, 4, 1) | 최대 1221 | 1.24 | 2.48 | 최대 30 | LPDDR4X | 32 GB | 256-비트 | 136.5 GB/s | 20-40 | ||
자비에르(Xavier) NX 16 GB | 카멜(Carmel) 10 MB 캐시 | 6 | 최대 1.9 | 볼타 | 384:48 (6, 3, 1) | 최대 1100 | 0.84 | 1.69 | 최대 21 | LPDDR4X | 16 GB | 128-비트 | 59.7 GB/s | 10-20 | ||
자비에르(Xavier) NX 8 GB | 카멜(Carmel) 10 MB 캐시 | 6 | 최대 1.9 | 볼타 | 384:48 (6, 3, 1) | 최대 1100 | 0.84 | 1.69 | 최대 21 | LPDDR4X | 8 GB | 128-비트 | 59.7 GB/s | 10-20 |
1 CUDA 코어 : 텐서 코어 (SM, TPC, GPC)
4. 7. 테그라 K1 (로건)
테그라 K1은 2014년에 출시되었으며, 28nm 공정의 ARM v7 프로세서이다. ARM Cortex-A15(r3) 코어 4개를 탑재하고 있으며, 192코어 케플러 GPU를 사용하여 16/32비트에서 365GFLOPS의 연산 성능을 제공한다.[236]Direct3D 12, OpenGL ES 3.1, CUDA 6.5, OpenGL 4.4/4.5, Vulkan을 지원하며, 적응형 확장 텍스처 압축을 지원한다.
4. 7. 1. 모델
구 분 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 |
---|---|---|---|---|---|
32비트 | Cortex-A15 r3, 4+1 코어, 최대 2.3 GHz | CUDA Kepler 192 코어, 950 MHz, 단정밀도 365 GFLOPS[236] | 64비트 듀얼 채널 LPDDR3, LPDDR3-L 14.9 GB/s | H.264, VP8 등 2160p 30fps 지원 | 3840x2160 (LCD), 4096x2160 (HDMI) |
64비트 | Denver, 2 코어, 최대 2.5 GHz[237] | CUDA Kepler 192 코어, 950 MHz, 단정밀도 365 GFLOPS[236] | 64비트 듀얼 채널 LPDDR3, LPDDR3-L 14.9 GB/s | H.264, VP8 등 2160p 30fps 지원 | 3840x2160 (LCD), 4096x2160 (HDMI) |
4. 8. 테그라 X1 (에리스타)
테그라 X1(코드명: 에리스타)은 4개의 ARM Cortex-A57 코어와 4개의 ARM Cortex-A53 코어를 가진 8코어 CPU 구조이다.[242][243] GPU는 맥스웰 아키텍처 기반이며, 적응형 확장 텍스처 압축(ASTC)을 지원한다.[246]테그라 X1은 닌텐도 스위치 등 일부 기기에서 오류 주입(FI) 전압 글리칭 공격에 취약하여 임의 코드 실행 및 홈브루 소프트웨어 구현이 가능한 것으로 알려져 있다.
4. 8. 1. 모델
wikitextrowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Tegra K1 | 28nm[232] (TSMC HPM) | Cortex-A15 r3 | 4 + 1 | ? - 2.3GHz | 단정밀도 73.6 GFLOPS[233] 배정밀도 18.4 GFLOPS[234] | 2 MB + 0.5 MB[235] | CUDA Kepler Unified Shader 192 코어 | 950MHz | 단정밀도 365 GFLOPS[236] | 64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s | H.264, VP8 등 2160p 30fps | 3840x2160 (LCD) 4096x2160 (HDMI) | 없음 |
Tegra K1 | Denver | 2 | ? - 2.5GHz[237] | 단정밀도 40 GFLOPS[238] 배정밀도 20 GFLOPS[239] | 2 MB[240] | ||||||||
Tegra X1[241] | 20nm (TSMC 20 SoC) | Cortex-A57 + Cortex-A53[242] | 4 + 4[243] | Cortex-A57 1.9GHz[244] | 2 MB + 0.5 MB[245] | CUDA Maxwell 256 코어[246] | 1024MHz | 단정밀도 512 GFLOPS[247] | 64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s[248] | H.265, VP9 등 2160p 30fps | 4096x2160 60fps | ||
Tegra X1+[249][250] | 16nm | Cortex-A57 + Cortex-A53 | 4 + 4 | Cortex-A57 1.9GHz | 2 MB + 0.5 MB | CUDA Maxwell 256 코어 | 1267MHz[251] | 단정밀도 649 GFLOPS | 64bit LPDDR4X | H.265, VP9 등 2160p 30fps | |||
Tegra X2 (Parker)[252] | 16nm | Denver 2 + Cortex-A57 | 2 + 4 | + | 2 MB + 2 MB | CUDA Pascal 256 코어 | 1465MHz | 단정밀도 750 GFLOPS | 128bit LPDDR4 58.4 GB/s | H.265, VP9 등 2160p 60fps |
4. 9. 테그라 X2 (파커)
테그라 X2(파커)는 엔비디아가 개발한 모바일 시스템 온 칩(SoC)이다. 16nm 공정으로 제조되었으며, 덴버 2 듀얼 코어 CPU와 ARM Cortex-A57 쿼드 코어 CPU를 결합하여 총 6개의 CPU 코어를 갖추고 있다. 또한, 파스칼 아키텍처 기반의 256개 CUDA 코어를 가진 GPU를 탑재하여 뛰어난 그래픽 성능을 제공한다.[252]CPU는 2.0 GHz로 작동하는 덴버 2 코어 2개와 2.0 GHz로 작동하는 Cortex-A57 코어 4개로 구성된다. GPU는 1465 MHz로 작동하며, 단정밀도 연산 성능은 750 GFLOPS, 반정밀도 연산 성능은 1.5 TFLOPS이다. 128bit LPDDR4 메모리를 사용하며, 메모리 대역폭은 58.4 GB/s이다. 비디오 인코딩은 H.265, VP9 등 2160p 60fps를 지원하며, 화면 해상도는 4096x2160 60fps까지 지원한다.[252]
4. 9. 1. 모델
rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Tegra K1 | 28nm[232] (TSMC HPM) | Cortex-A15 r3 | 4 + 1 | ? - 2.3 GHz | 단정밀도 73.6 GFLOPS[233] 배정밀도 18.4 GFLOPS[234] | 2 MB + 0.5 MB[235] | CUDA Kepler Unified Shader 192 코어 | 950 MHz | 단정밀도 365 GFLOPS[236] | 64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s | H.264, VP8 등 2160p 30fps | 3840x2160 (LCD) 4096x2160 (HDMI) | 없음 |
Tegra K1 | Denver | 2 | ? - 2.5 GHz[237] | 단정밀도 40 GFLOPS[238] 배정밀도 20 GFLOPS[239] | 2 MB[240] | ||||||||
Tegra X1[241] | 20nm (TSMC 20 SoC) | Cortex-A57 + Cortex-A53[242] | 4 + 4[243] | Cortex-A57 1.9 GHz[244] | rowspan="2" | | 2 MB + 0.5 MB[245] | CUDA Maxwell 256 코어[246] | 1024 MHz | 단정밀도 512 GFLOPS[247] | 64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s[248] | H.265, VP9 등 2160p 30fps | 4096x2160 60fps | |
Tegra X1+[249][250] | 16nm | 1267 MHz[251] | 단정밀도 649 GFLOPS | 64bit LPDDR4X | |||||||||
Tegra X2 (Parker)[252] | 16nm | Denver 2 + Cortex-A57 | 2 + 4 | 2.0 GHz + 2.0 GHz | 2 MB + 2 MB | CUDA Pascal 256 코어 | 1465 MHz | 단정밀도 750 GFLOPS | 128bit LPDDR4 58.4 GB/s | H.265, VP9 등 2160p 60fps |
rowspan="2" | | 제조 공정 | 아키텍처 | CPU | GPU | 메모리 | 비디오 인코딩 | 화면 해상도 | 모뎀 | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코어 수 | 클럭 | 연산 성능 | L2 캐시 | L3 캐시 | 코어 수 | 클럭 | 연산 성능 | |||||||
Xavier[253] | 12nm | NVIDIA Carmel Arm®v8.2 | 8 | 1.9GHz(Nano) 2.2 GHz(AGX) | 6MB[253] | 4MB[253] | CUDA Volta 384코어 Tensor 48코어(Nano) | 1.1 GHz(Nano) | 단정밀도 1410 GFLOPS | 128bit LPDDR4X 59.7 GB/s | H.265,VP9 등 4K 60fps | 3840x2160 60fps | ||
Orin[255] | 8nm | Cortex®-A78AE v8.2 | 12 | 1.5GHz(Nano) 2.2 GHz(AGX) | 1.5MB(Nano) 3MB(AGX) | 4MB(Nano) 6MB(AGX) | CUDA Ampere 512코어 Tensor 16코어(Nano) | 625 MHz(Nano) | 단정밀도 0.64 – 5.32 TFLOPS | 128bit LPDDR5 102.4 GB/s | H.265,VP9,AV1 등 4K 60fps | 3840x2160 60fps |
4. 10. 자비에 (Xavier)
자비에(Xavier) 테그라 SoC는 만화 캐릭터인 프로페서 X의 이름을 따서 명명되었으며, 2016년 9월 28일에 발표되었고, 2019년 3월까지 출시되었다.[131]이 칩은 70억 개의 트랜지스터, 8개의 커스텀 ARMv8 코어, 512개의 CUDA 코어를 가진 볼타 GPU, DLA(Deep Learning Accelerator)라는 오픈 소스 TPU를 포함하고 있다.[132][133] 8K 울트라 HD (7680×4320)를 인코딩하고 디코딩할 수 있다. 사용자는 필요에 따라 10W, 15W, 30W TDP에서 작동 모드를 구성할 수 있으며, 다이 크기는 350 mm2이다.[134][135][136] 엔비디아는 2018년 CES에서 제조 공정이 12 nm FinFET임을 확인했다.[137]
- CPU: 엔비디아 커스텀 카멜(Carmel) ARMv8.2-A (64비트), 8코어 10-와이드 수퍼스칼라[138]
- GPU: 볼타 기반, 1.4 TFLOPS의 512 CUDA 코어;[139] 유형: GV11B[140][120]
- TSMC 12 nm, FinFET 공정
- 20 TOPS DL 및 160 SPECint @ 20 W; 30 TOPS DL @ 30 W[136] (TOPS DL = Deep Learning Tera-Ops)
- GPU 기반 텐서 코어를 통해 20 TOPS DL
- DLA 유닛을 통해 10 TOPS DL (INT8), 5 TFLOPS (FP16) 달성[139]
- PVA 유닛(Programmable Vision Accelerator, 스테레오 불일치/광학 흐름/이미지 처리를 위한)[141]에서 1.6 TOPS
- ISP 유닛(이미지 신호 프로세서, 네이티브 풀 레인지 HDR 및 타일 처리 지원)에서 1.5 GPix/s
- 8k 비디오 지원을 포함한[135] 1.2 GPix/s 인코딩 및 1.8 GPix/s 디코딩을 위한 비디오 프로세서[139]
- 16 레인의 MIPI-CSI-3[142][143]
- 1 Gbit/s 이더넷
- 10 Gbit/s 이더넷
4. 10. 1. 모델
(모델)(GHz)
아키텍처
구성1
(MHz)
(FP32)
(FP16)
(INT8)
폭
(GB/s)